BIDS Projekt

Gruppe 3

Constanze Leichtweiß
Ivanna Marchesini
Christoph Kovacs
Enrico Wondra

Einführung

Sample Vorbereitung

RNA-Seq Pipeline

Wirkungsweise

flowchart TD
    RTK["Rezeptor-Tyrosinkinase (zB EGFR, VEGFR)"]
    RAS["RAS (GTPase)"]
    RAF["RAF-Kinase (inkl. BRAF)"]
    MEK["MEK1/2-Kinase"]
    ERK["ERK1/2-Kinase"]
    PRO["Zellproliferation und Überleben"]

    RTK --> RAS --> RAF --> MEK --> ERK --> PRO

    SORA["**Sorafenib** (RAF-Hemmer)"] -.-> RAF
    TRAM["**Trametinib** (MEK-Hemmer)"] -.-> MEK

    style SORA fill:yellow,stroke:orange,stroke-width:2px
    style TRAM fill:aqua,stroke:blue,stroke-width:2px

Analyse

Ziel:
Unterschiede in der Genexpression finden

  • Aufstellen einer Nullhypothese H0: kein Unterschied

  • Gegenhypothese: Es gibt einen Unterschied

  • Negative Binominalverteilung zur Modellierung der Counts

  • Fold Change = Wert Bedingung (Sora) / Wert Bedingung (DMSO)

  • Logarithmierte Fold Change hat Vorteile beim Rechnen (Linear / Additiv)

  • Ergänzung zum log2FoldChange?

Vorbereitung

  • Erstellen einer Count-Matrix
  • Filtern der Daten
# Filter: min. 2 Spalten mit je mehr als 10 Counts benötigt

keep <- rowSums(counts(dds) >= 10) >= 2
sum(keep) # Behalte 18,198 Records für die Analyse (31%)
sum(dim(count_matrix)[1]-sum(keep)) # Verwerfe 39,575 Records (69%)
  • Erstellen des DeSeq2-Objekts
  • Transformieren und Normalisieren der Beobachtungen

Count-Daten

Explorative Analyse

Strukturfindung

Optimale Anzahl Komponenten für PCA

  • Nur Top 500 Gene miteinbezogen
  • 2-3 Komponenten optimal

  • Klare Separierbarkeit entlang PC1
  • Stabile Kontrollgruppe
  • Sora deutlich von DMSO unterschieden
  • Tram mit In-Sample Unterschieden (PC2)
  • Problem: Misst nur linearen Zusammenhang
  • PC3 erklärt nur knapp 7% der Gesamtvarianz
  • Keine bessere Separabilität

t-distributed Stochastic Neighbor Embedding

  • Misst lokalen nicht-linearen Zusammenhang
  • Deutliche Cluster der drei Treatments
  • Trametinib kohärenter als bei PCA

Uniform Manifold Approximation and Projection

  • Misst lokalen und globalen Zusammenhang
  • “Gradientenstruktur” DMSO → Tram → Sora
  • Problem: Zu wenige Samples

Differenzielle Expressions Analyse (DEG)

Signifikant regulierte Gene

  • Sorafenib ca. 3500 hoch- und runterregulierte Gene
  • Trametinib nur ca. 800

Gemeinsam regulierte Gene

Signifikanz einzelner Gene

  • ↑↑↑ CDX2, BMF, PCK1, CDKN1B
    Zellzyklushemmung, Apoptose, Differenzierung
  • ↓↓↓ TNS4, MYC, FOSL1, SPRY4, IER3
    Tumorwachstumsmechanismen

  • ↑↑↑ BMF, CYP1A, ASCL2
    Zellulärer Stress bzw. Schadensantworten
  • ↓↓↓ TNS4, IER3, FOSL1
    MAPK-assoziierte Proliferation, Stressantworten und zelluläre Bewegung

Gene Set Enrichment (GSE) and KEGG Pathway Analyse

Signalwege, hochreguliert

Signalwege, herunterreguliert

Nächste Schritte

Variant Calling

Referenzen

Qi GX, Zhao RX, Gao C, Ma ZY, Wang S, Xu J. Recent advances and challenges in colorectal cancer: From molecular research to treatment. World J Gastroenterol. 2025 Jun 7;31(21):106964. doi: 10.3748/wjg.v31.i21.106964. PMID: 40538516; PMCID: PMC12175868.

Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan 1;29(1):15-21. doi: 10.1093/bioinformatics/bts635. Epub 2012 Oct 25. PMID: 23104886; PMCID: PMC3530905.

Li J, Varghese RS, Ressom HW. RNA-Seq Data Analysis. Methods Mol Biol. 2024;2822:263-290. doi: 10.1007/978-1-0716-3918-4_18. PMID: 38907924; PMCID: PMC12125953.

Koch CM, Chiu SF, Akbarpour M, Bharat A, Ridge KM, Bartom ET, Winter DR. A Beginner’s Guide to Analysis of RNA Sequencing Data. Am J Respir Cell Mol Biol. 2018 Aug;59(2):145-157. doi: 10.1165/rcmb.2017-0430TR. PMID: 29624415; PMCID: PMC6096346.